Omitted Variable Bias

多元情形

假设实际结构方程为

Y=XTβ+γZ+u

估计的结构方程为

Y=XTβ+v

这意味着

E[Xv]=E[X(γZ+u)]=γE[XZ]+E[Xu]=γE[XZ]0

因此存在内生性问题。此时

β=E[XXT]1E[XY]=E[XXT]1E[X(XTβ+γZ+u)]=β+γE[XXT]1E[XZ]+0=β+γδ

其中 δZX 回归的系数。

flowchart LR
X --> | 〈β〉 |Y
Z --> | 〈δ〉 |X
Z --> | 〈γ〉 |Y

可见遗漏变量偏差的符号和大小由 γδ 共同决定。例如,ZXY 的影响都很小则遗漏变量偏差并不严重,不过这一点不容易检验。

一元情形

假设实际的结构方程为

Y=α+βX+γZ+u

估计的结构方程为

Y=α+βX+v

此时

β=Cov(X,Y)Var(X)=Cov(X,α+βX+γZ+u)Var(X)=βVar(X)+γCov(X,Z)Var(X)=β+γδ

其中 δXZ 回归的系数。

flowchart LR
X --> | 〈β〉 |Y
Z --> | 〈δ〉 |X
Z --> | 〈γ〉 |Y

或者

β=Cov(X,α+βX+v)Var(X)=β+Cov(X,v)Var(X)=β+Cov(X,v)Var(X)Var(v)Var(v)Var(X)=β+ρ(X,v)σvσX

可见遗漏变量偏差的符号和大小由 ρ(X,v)=γρ(X,Z) 以及相对标准差共同决定。例如,X 的方差很大但 v 的方差很小,则遗漏变量偏差并不严重,这一点很容易检验。